<汇港通讯> 腾讯混元正式发布混元图像2.0模型,指其两大特点为实时生图和超写实画质。
腾讯混元指,相比前代模型,混元图像2.0模型参数量提升了一个数量级,可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统抽卡-等待-抽卡的方式。
此外,新模型图像生成质量提升明显,生成的图像可有效避免人工智能内容生成(AIGC)图像中的AI味,真实感强、细节丰富、可用性高。
腾讯混元指,混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解在说什麽,更能推测出希望画面「怎麽表达」。 (ST)
#腾讯混元 (ST)
新闻来源 (不包括新闻图片): 汇港资讯